检索结果

Select

1. 基于元网络的自动国际疾病分类编码模型

周晓敏, 滕飞, 张艺

《计算机应用》唯一官方网站 2023, 43 (9): 2721-2726. DOI: 10.11772/j.issn.1001-9081.2022091388

摘要（247）

HTML （11）

PDF （1032KB）（103）

国际疾病分类（ICD）编码的频率分布呈现出长尾的情况，因此，对少样本编码进行多标签文本分类极具挑战性。针对少样本编码分类中训练数据不足的问题，提出了一种基于元网络的自动ICD编码模型（MNIC）。首先，将特征空间中的实例和语义空间中的特征拟合到同一个空间进行映射，并将频繁编码的特征表示映射到它的分类器权重上，从而通过元网络学习到元知识；然后将学习到的元知识从数据丰富的频繁编码转移到数据贫乏的少样本编码；最后，为元知识的可转移性和通用性提供了合理的解释。在MIMIC-Ⅲ数据集上的实验结果表明，与次优的AGM-HT（Adversarial Generative Model conditioned on code descriptions with Hierarchical Tree structure）模型相比，MNIC将少样本编码的Micro-F1与曲线下面积（Micro-AUC）分别提高了3.77和3.82个百分点，显著提高了少样本编码分类的性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于状态信息的红外小目标跟踪方法

唐鑫, 彭博, 滕飞

《计算机应用》唯一官方网站 2023, 43 (6): 1938-1942. DOI: 10.11772/j.issn.1001-9081.2022050762

摘要（422）

HTML （11）

PDF （1552KB）（136）

红外小目标所占像素较少，且缺乏颜色、纹理、形状等特征，因此难以有效地跟踪它们。针对这一问题，提出了一种基于状态信息的红外小目标跟踪方法。首先，将待跟踪小目标局部区域的目标、背景和干扰物进行编码以得到连续帧之间密集的局部状态信息；其次，将当前帧和上一帧的特征信息输入分类器，得到分类得分；然后，融合状态信息和分类得分，从而得到最终置信度并确定待跟踪小目标的中心位置；最后，更新状态信息并在连续帧之间传播，在此之后利用传播的状态信息完成对整个序列中红外小目标的跟踪。在DIRST（Dataset for Infrared detection and tRacking of dim-Small aircrafT）数据集上评估所提方法。实验结果显示，所提方法针对红外小目标的跟踪召回率达到了96.2%，精确率达到了97.3%，相较于目前最优秀的通过跟踪方法KeepTrack召回率和精确率分别提高了3.7%和3.7%。这表明所提方法在复杂的背景与干扰下能有效完成针对红外小目标的跟踪。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于深度自编码的医疗命名实体识别模型

侯旭东, 滕飞, 张艺

《计算机应用》唯一官方网站 2022, 42 (9): 2686-2692. DOI: 10.11772/j.issn.1001-9081.2021071317

摘要（223）

HTML （18）

PDF （979KB）（100）

针对在医疗命名实体识别（MNER）问题中随着网络加深，基于深度学习的识别模型出现的识别精度与算力要求不平衡的问题，提出一种基于深度自编码的医疗命名实体识别模型CasSAttMNER。首先，使用编码与解码间深度差平衡策略，以经过蒸馏的Transformer语言模型RBT6作为编码器以减小编码深度以及降低对训练和应用上的算力要求；然后，使用双向长短期记忆（BiLSTM）网络和条件随机场（CRF）提出了级联式多任务双解码器，从而完成实体提及序列标注与实体类别判断；最后，基于自注意力机制在实体类别中增加实体提及过程抽取的隐解码信息，以此来优化模型设计。实验结果表明，CasSAttMNER在两个中文医疗实体数据集上的F值度量可分别达到0.943 9和0.945 7，较基线模型分别提高了3个百分点和8个百分点，验证了该模型更进一步地提升了解码器性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于长-短时序特征融合的资源负载预测模型

王艺霏, 于雷, 滕飞, 宋佳玉, 袁玥

《计算机应用》唯一官方网站 2022, 42 (5): 1508-1515. DOI: 10.11772/j.issn.1001-9081.2021030393

摘要（447）

HTML （23）

PDF （2857KB）（186）

高准确率的资源负载预测能够为实时任务调度提供依据，从而降低能源消耗。但是，针对资源负载的时间序列的预测模型，大多是通过提取时间序列的长时序依赖特性来进行短期或者长期预测，忽略了时间序列中的短时序依赖特性。为了更好地对资源负载进行长期预测，提出了一种基于长-短时序特征融合的边缘计算资源负载预测模型。首先，利用格拉姆角场（GAF）将时间序列转变为图像格式数据，以便利用卷积神经网络（CNN）来提取特征；然后，通过卷积神经网络提取空间特征和短期数据的特征，用长短期记忆（LSTM）网络来提取时间序列的长时序依赖特征；最后，将所提取的长、短时序依赖特征通过双通道进行融合，从而实现长期资源负载预测。实验结果表明，所提出的模型在阿里云集群跟踪数据集CPU资源负载预测中的平均绝对误差（MAE）为3.823，均方根误差（RMSE）为5.274，拟合度（R²）为0.815 8，相较于单通道的CNN和LSTM模型、双通道CNN+LSTM和ConvLSTM+LSTM模型，以及资源负载预测模型LSTM-ED和XGBoost，所提模型的预测准确率更高。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 基于微操作的Hadoop参数自动调优方法

李耘书, 滕飞, 李天瑞

计算机应用 2019, 39 (6): 1589-1594. DOI: 10.11772/j.issn.1001-9081.2018122592

摘要（387）

PDF （931KB）（250）

Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用，针对手动和经验调优方法中参数空间庞大和运行流程复杂的问题，提出了一种Hadoop参数自动优化的方法和分析框架。首先，对作业运行流程进行解耦，从可变参数直接影响的更细粒度的角度定义微操作，从而分析参数和单次微操作执行时间的关系；然后，利用微操作对作业运行流程进行重构，建立参数和作业运行时间关系的模型；最后，在此模型上应用各类搜索优化算法高效快速得出优化后的系统参数。在terasort和wordcount两个作业类型上进行了实验，实验结果表明，相对于默认参数情况，该方法使作业执行时间分别缩短了至少41%和30%。该方法能够有效提高Hadoop作业执行效率，缩短作业执行时间。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于长短期记忆多维主题情感倾向性分析模型

滕飞, 郑超美, 李文

计算机应用 2016, 36 (8): 2252-2256. DOI: 10.11772/j.issn.1001-9081.2016.08.2252

摘要（730）

PDF （784KB）（706）

针对中文微博全局性情感倾向分类的准确性不高的问题，提出基于长短期记忆模型的多维主题模型（MT-LSTM）。该模型是一个多层多维序列计算模型，由多维长短期记忆（LSTM）细胞网络组成，适用于处理向量、数组以及更高维度的数据。该模型首先将微博语句分为多个层次进行分析，纵向以三维长短期记忆模型（3D-LSTM）处理词语及义群的情感倾向，横向以多维长短期记忆模型（MD-LSTM）多次处理整条微博的情感倾向；然后根据主题标签的高斯分布判断情感倾向；最后将几次判断结果进行加权得到最终的分类结果。实验结果表明，该算法平均查准率达91%，最高可达96.5%；中性微博查全率高达50%以上。与递归神经网络（RNN）模型相比，该算法F-测量值提升40%以上；与无主题划分的方法相比，细致的主题划分可将F-测量值提升11.9%。所提算法具有较好的综合性能，能够有效提升中文微博情感倾向分析的准确性，同时减少训练数据量，降低匹配计算的复杂度。

参考文献 | 相关文章 | 多维度评价

Select

7. 适应用户兴趣变化的改进型协同过滤算法

胡伟健, 滕飞, 李灵芳, 王欢

计算机应用 2016, 36 (8): 2087-2091. DOI: 10.11772/j.issn.1001-9081.2016.08.2087

摘要（449）

PDF （767KB）（411）

协同过滤算法可以根据用户的历史行为记录去预测其可能喜欢的物品，是现在业界应用极为广泛的推荐算法。但传统的协同过滤算法并没有考虑到用户兴趣的概念漂移，在一些基于时间的协同过滤算法中对推荐时效性的考虑也有所欠缺。针对这些问题，结合用户兴趣随时间转移的特点，改进了相似度的度量方法，同时引入一种增强的时间衰减模型来度量预测值，并将这两种方式有机地结合起来，解决了用户兴趣的概念漂移问题并考虑了推荐算法的时效性。仿真实验中，分别在不同的数据集中对比了该算法与UserCF、TCNCF、PTCF以及TimeSVD++算法的预测评分准确度和Top N推荐准确度。实验结果表明，改进算法能够降低预测评分的均方根误差（RMSE），并在Top N推荐准确度上均优于对比算法。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于心跳超时机制的Hadoop实时容错技术

关国栋, 滕飞, 杨燕

计算机应用 2015, 35 (10): 2784-2788. DOI: 10.11772/j.issn.1001-9081.2015.10.2784

摘要（471）

PDF （754KB）（385）

针对官方的Hadoop软件中提供的节点心跳超时容错机制对短作业并不合理,而且忽略了异构集群中各节点超期时间设置的公平性的问题,提出了公平心跳超时容错机制。首先根据每个节点的可靠性及计算性能构建节点故障误判损失模型,提出公平误判损失(FMJL)算法,使其同时满足长作业和短作业要求;接着,设计并实现了基于FMJL算法的公平超时机制。在实现了公平超时机制的Hadoop上运行大约345 s的短作业时,当出现TaskTracker节点故障时作业完成时间平均大约节省了44%,与自适应超时机制相比,作业完成时间大约节省了23%。实验结果表明,公平超时机制在保证不影响长作业完成时间的情况下缩短了短作业的容错处理时间,提高了Hadoop的实时处理效率。

参考文献 | 相关文章 | 多维度评价

Select

9. 融合异构信息的自动ICD编码方法

张全梅黄润萍滕飞张海波周南